Maximale Anzahl von Instanzen (Diensten) festlegen

Auf dieser Seite wird beschrieben, wie Sie die maximale Anzahl von Instanzen festlegen, die für Ihren Cloud Run-Dienst verwendet werden können. Durch die Angabe von maximalen Instanzen in Cloud Run können Sie die Skalierung Ihres Dienstes als Reaktion auf eingehende Anfragen begrenzen, obwohl diese Maximaleinstellung aufgrund von Umständen wie Trafficspitzen für kurze Zeit überschritten werden kann. Verwenden Sie diese Einstellung, um Ihre Kosten zu kontrollieren oder die Anzahl der Verbindungen zu einem Sicherungsdienst zu begrenzen, z. B. zu einer Datenbank.

Informationen zu den Limits für die maximale Anzahl von Instanzen, die für Ihren Dienst gelten können, finden Sie unter Maximale Instanzlimits.

Weitere Informationen dazu, wie Cloud Run Container-Instanzen automatisch skaliert, finden Sie unter Instanz-Autoscaling.

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen zu gewähren, um die Berechtigungen zu erhalten, die Sie zum Konfigurieren und Bereitstellen von Cloud Run-Diensten benötigen:

Eine Liste der IAM-Rollen und -Berechtigungen im Zusammenhang mit Cloud Run finden Sie unter IAM-Rollen für Cloud Run und IAM-Berechtigungen für Cloud Run. Wenn Ihr Cloud Run Service mit Google Cloud APIs wie Cloud-Clientbibliotheken verknüpft ist, lesen Sie die Konfigurationsanleitung für Dienstidentitäten. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Bereitstellungsberechtigungen und Zugriff verwalten.

Maximale Instanzen festlegen und aktualisieren

Jede Konfigurationsänderung führt zur Erstellung einer neuen Überarbeitung. Für nachfolgende Überarbeitungen gilt automatisch dieselbe Konfigurationseinstellung, sofern Sie sie nicht explizit aktualisieren.

Standardmäßig sind Cloud Run-Dienste so konfiguriert, dass sie auf maximal 100 Instanzen skaliert werden können.

Sie können die Einstellung für die maximale Anzahl von Instanzen über die Google Cloud Console, die gcloud-Befehlszeile oder eine YAML-Datei ändern, wenn Sie einen neuen Dienst erstellen oder eine neue Revision bereitstellen.

Console

  1. Rufen Sie in der Google Cloud Console Cloud Run auf.

    Zu Cloud Run

  2. Klicken Sie auf Container bereitstellen und wählen Sie Dienst aus, um einen neuen Dienst zu konfigurieren. Wenn Sie einen vorhandenen Dienst konfigurieren möchten, klicken Sie auf den Dienst und dann auf Neue Überarbeitung bearbeiten und bereitstellen.

  3. Wenn Sie einen neuen Dienst konfigurieren, füllen Sie die Seite mit den anfänglichen Diensteinstellungen aus und klicken Sie dann auf Container, Volumes, Netzwerk, Sicherheit, um die Seite zur Dienstkonfiguration zu maximieren.

  4. Klicken Sie auf den Tab Container.

    Bild

    • Im Feld mit der Bezeichnung Maximale Anzahl von Instanzen geben Sie die gewünschte maximale Anzahl von Instanzen mit einem beliebigen Ganzzahlwert von 1 bis maximales Limit an.
  5. Klicken Sie auf Erstellen oder Bereitstellen.

gcloud

Mit dem folgenden Befehl können Sie die maximale Anzahl von Instanzen eines bestimmten Dienstes aktualisieren:

gcloud run services update SERVICE --max-instances MAX-VALUE

Ersetzen

  • SERVICE durch den Namen Ihres Dienstes und
  • MAX-VALUE durch die gewünschte maximale Anzahl von Containerinstanzen. Verwenden Sie einen beliebigen Ganzzahlwert von 1 bis zum maximalen Limit. Geben Sie default an, um alle maximalen Instanzeinstellungen zu löschen und die Standardeinstellung von 100 Instanzen wiederherzustellen.

Mit dem folgenden Befehl können Sie auch während der Bereitstellung die maximale Anzahl von Instanzen festlegen:

gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE

Ersetzen

  • IMAGE_URL durch einen Verweis auf das Container-Image, z. B. us-docker.pkg.dev/cloudrun/container/hello:latest. Wenn Sie Artifact Registry verwenden, muss das Repository REPO_NAME bereits erstellt sein. Die URL hat die Form LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG.
  • MAX-VALUE durch die gewünschte maximale Anzahl von Containerinstanzen.

YAML

  1. Wenn Sie einen neuen Dienst erstellen, überspringen Sie diesen Schritt. Wenn Sie einen vorhandenen Dienst aktualisieren, laden Sie die zugehörige YAML-Konfiguration herunter:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Aktualisieren Sie das Attribut autoscaling.knative.dev/maxScale::

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          annotations:
            autoscaling.knative.dev/maxScale: 'MAX-INSTANCE'
          name: REVISION

    Ersetzen

    • SERVICE durch den Namen Ihres Cloud Run-Dienstes
    • MAX-INSTANCE durch die gewünschte Höchstzahl.
    • REVISION durch einen neuen Überarbeitungsnamen oder löschen (falls vorhanden). Wenn Sie einen neuen Überarbeitungsnamen angeben, muss er die folgenden Kriterien erfüllen:
      • Beginnt mit SERVICE-
      • Enthält nur Kleinbuchstaben, Ziffern und -
      • Endet nicht mit -
      • Darf nicht mehr als 63 Zeichen enthalten
  3. Erstellen oder aktualisieren Sie den Dienst mit dem folgenden Befehl:

    gcloud run services replace service.yaml

Terraform

Informationen zum Anwenden oder Entfernen einer Terraform-Konfiguration finden Sie unter Grundlegende Terraform-Befehle.

Die folgende google_cloud_run_v2_service-Ressource gibt die maximale Anzahl von 10-Instanzen unter template.scaling an. Ersetzen Sie 10 durch die gewünschte maximale Anzahl von Instanzen.

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-max-instances"
  location = "us-central1"

  deletion_protection = false # set to "true" in production

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"
    }
    scaling {
      # Max instances
      max_instance_count = 10
    }
  }
}

Limits für die maximale Anzahl von Instanzen

Standardmäßig sind Cloud Run-Dienste auf maximal 100 Instanzen konfiguriert.

Die maximale Obergrenze hängt von der Region des Cloud Run-Dienstes und seinen CPU- und Arbeitsspeicherkonfigurationen ab.

Auf der Seite „Kontingente“ werden die grundlegenden Kontingente pro Region angezeigt.

Die maximale Anzahl von Instanzen wird bestimmt als das Minimum von:

  • regionales Basiskontingent / gewünschtes Vielfaches von 1 CPU
  • regionales Basiskontingent / gewünschtes Vielfaches von 2 GB Speicher

Beispielsweise hat ein Basiskontingent von 1.000 Instanzen mit 4 GB Arbeitsspeicher oder 2 CPUs ein effektives Limit von 500.

Wenn Sie eine maximale Anzahl von Instanzen angeben möchten, die die in der Region des Cloud Run-Dienstes zulässige maximale Anzahl überschreitet, müssen Sie eine Kontingenterhöhung anfordern.

Einstellungen für die maximale Anzahl von Instanzen ansehen

So rufen Sie die aktuellen Einstellungen der maximalen Instanzen für Ihren Cloud Run-Dienst auf:

Console

  1. Rufen Sie in der Google Cloud Console Cloud Run auf.

    Zu Cloud Run

  2. Klicken Sie auf den gewünschten Dienst, um die Seite Dienstdetails zu öffnen.

  3. Klicken Sie auf den Tab Überarbeitungen.

  4. Im Detailbereich rechts wird die Einstellung für die maximale Anzahl von Instanzen auf dem Tab Container aufgelistet.

gcloud

  1. Verwenden Sie den folgenden Befehl:

    gcloud run services describe SERVICE
  2. Suchen Sie in der zurückgegebenen Konfiguration nach der Einstellung für die maximale Anzahl von Instanzen.